昨天我們處理了數字欄位,把「帶逗號的字串數字」轉換成可以運算的數值型態。今天,我們要來計算股票數據的基本統計值,這些統計結果能幫助我們快速掌握整體走勢。
在股市分析中,單純看一堆每天的股價數字,往往很難快速得出結論。所以我們通常會先整理出一些關鍵指標,例如:
這些統計值相當於「總覽」,能讓我們快速知道該股票在一段時間內的整體表現。
我們假設已經有一份股價資料 DataFrame,接著使用 Pandas 的函式計算統計數據:
import pandas as pd
# 假設 df 已經包含股票資料
# df 裡有 'Close' (收盤價) 和 'Volume' (成交量) 欄位
df_stats = pd.DataFrame({
'Average Price': [df['Close'].mean()], # 平均收盤價
'Highest Price': [df['Close'].max()], # 最高收盤價
'Lowest Price': [df['Close'].min()], # 最低收盤價
'Total Volume': [df['Volume'].sum()] # 成交量總和
})
print("\n--- 基本統計 ---")
print(df_stats)
這段程式碼做了幾件事:
最後用一個新的 DataFrame (df_stats) 來集中展示這些統計數據。
假設我們有一段時間的資料,結果可能會長這樣:
--- 基本統計 ---
Average Price Highest Price Lowest Price Total Volume
0 1275.6 1300 1250 235000000
這樣就能清楚看到整體的統計結果,比單看一堆零散的數字還要有意義。
有了這些統計基礎,我們就能進一步做可視化圖表或趨勢分析,讓資料更直觀。
那今天就先這樣。